心理学没准就是放狗屁,不过倒也无妨

原文:Psychology might be a big stinkin’ load of hogwash and that’s just fine

你好,我想伸进你的脑袋里,把你对我挚爱的心理学所持有的那些谬误一把扯出来

作者:Adam Mastroianni

2022 年 9 月 21 日

大约 10 年前,一位著名心理学家发现,人类拥有超自然的心灵感应能力。在 Daryl Bem 的实验室里,参与者预测一张色情图片在屏幕出现的位置,其准确率竟然高于随机概率——甚至在电脑随机决定位置之前就猜到了。换句话说,在一件事情不可能被预知的情况下,人们似乎在冥冥中预见了——至少比纯粹乱蒙要准确那么一丁点儿。

(你可能会问:为什么图片非得是色情的?Bem 没有解释,不过人们的心灵感应能力似乎只对香艳照片有效,对普通照片则毫无反应。也许,人们需要靠一点色心来激活预知未来的超能力。)

如果这只是个孤例,我们大可以一笑置之。但 Bem 的论文包含了九个实验,展示了各种形式的「预知」与「预感」能力。九个实验,怎么也称不上是孤例了。

这让许多心理学家大为光火,因为人类本不应该拥有什么超自然能力。更要命的是,Bem 的论文发表在《个性与社会心理学期刊》(Journal of Personality and Social Psychology)上,这是该领域最权威的全球期刊。我们也无法把他当成什么不入流的民科——Bem 是康奈尔大学的终身教授,他的自我知觉理论是心理学导论课的必读内容。这位老兄来头不小,如今却声称 ESP(译注:Extra-Sensory Perception 的缩写,超感官知觉,俗称「第六感」) 确实存在,而且他的论文通过了同行评审,堂而皇之地出现在心理学最顶级的期刊之一上。

这场灾难使得心理学进入了一段至暗时期,这段时期后来被称为「复现危机」。同年晚些时候,第二波灾难袭来:一个心理学团队证明了,使用普遍的统计手段竟能导出荒谬的结论——比如听一首披头士的歌能让大学生神奇地逆龄生长。第三波,也是最惨烈的一波,发生在 2015 年——一大群社会科学家尝试重复 100 项心理学研究,结果只有不到一半的实验「成功复现」,意思是这些研究没能重现最初的结果,全部打了水漂。

2016 年,我开始读博,正好赶上跌入谷底的时刻。我看到一群研究生,眼眶深陷、神情恍惚、四处游荡,仿佛父母刚打来电话说「我们从来就没爱过你,这一切都是个恶作剧,永别了」。知名教授们把自己关在办公室里,洋洋洒洒地写起檄文(已被删除,但这里有备份),声称自己的研究之所以无法复现,全是因为那帮复刻者心怀怨毒、不学无术。网上,因为某位女教授的一项研究无法复现,博主和评论者对她展开了无情的围攻,事情闹大到《纽约时报》专门为此写了一篇报道。而在派对上,每当我自我介绍说是心理学家,就免不了遇到某个大概只听过一期复现危机播客的家伙凑过来说「哦,但那些研究不都没法复现吗?」然后用那副得意的笑容打量我,就好像我刚坦白自己是一名文艺复兴节的演员——意思是,我沉迷于公开表演令人尴尬的扮家家酒。

天似乎要塌了,但包括我的博士导师 Dan Gilbert 在内的少数人坚持认为,天还在它该在的地方。当然,没有人真的相信 ESP 或大二学生逆龄生长这种事(也许 Daryl Bem 除外),大家也都认同应该遏制那些让这类幻想得以成立的研究。但那篇「大多数心理学研究无法复现」的论文影响力太大了。Dan 和他的同事们指出,这些武断的结论噪声太大,以至于既可以解读为可重复性极好,也可以解读为极差。而且,精心挑出 100 项研究就声称可以代表整个心理学,就好比漫步到街角酒吧,随机问几个看起来面善的人,就宣称自己能预测选举结果。此外,某些复现研究用了大相径庭的实验方式。比如:

一项原始研究要求以色列人想象服兵役的重要性,而复现研究却改成要求美国人想象度蜜月的重要性;一项原始研究要求年幼儿童在大屏幕上完成较难的标靶定位任务,复现时却换成让年长儿童在小屏幕上完成更简单的任务;一项原始研究以韩国人为对象,展示了措辞的改变是如何提高慈善求助信的回复率,而复现实验,却变成了向全球各地的人发送 77,1408 封电子邮件(结果所有条件下的回复率几乎都是0%)。

好了,总之就是这帮人说了这些,那帮人说了那些。到底该怎么想?你可以不辞劳苦地把原始论文回应文回应的回应回应的回应的回应,以及回应的回应的回应的后续,全部认认真真读一遍。或者你就接着往下看,因为我有话要说——这些话我从未听别人提出过,它在我胸腔里憋了好久,躁动不安,随时要像《异形》里那只外星生物一样破体而出。

所以,它来了。这篇文章献给每一个在派对上冷笑的家伙——他们总是说「哦,心理学不全都是编出来的假货嘛」,「哦,呃,其实——」当我正筹备我的措辞时,总会有人硬生生地挤到我们中间喊道「我的老天,Kyle,你怎么在这!来喝一杯!」……不用说,我们关于复现危机错综复杂的探讨也就到此为止了。

这篇,是为你而写的,Kyle。

把笔叼在嘴里,不会让你像个剑士,只会让你看起来更好笑

首先,每当我们聊到复现危机,总是把两件截然不同的事搅和在一起。一件是「完蛋了,我们的研究方法、统计手段和证据标准烂到家了,搞得人人都能『证明』ESP 是真实存在的」——这确实很糟糕!我们理应有所作为;实际上,我们已经有所行动了。以前,你拉来区区 20 名受试者,在某种条件下就敢宣称「嘿伙计们,我刚证明了脑子里想着足球流氓会让你变笨」(实际上根本不会)。放到今天,这样做只会让你被轰出门去。我认为这是好事!

但与之而来的另一件事是「既然如此,我们现在就该回头把每一项心理学研究重新核查一遍」亲爱的 Kyle,这一点在我看来毫无道理。首先,你真的看过那些正在复现的那些研究吗?看看这一项

在回答了一组高难度常识题后,比起普通的词汇,受试者更容易联想到与电脑相关的词汇;其原始实验是这样的:在改良版斯特鲁普任务中(译注:一种测量词汇激活程度的心理学实验,通常利用与字体颜色不一致的色彩词汇来测试反应时间),由电脑词汇启动的颜色命名反应时间比非电脑词汇启动时更长。

再看这一项

原始研究发现,当人们被提醒自己正处于某段体验的尾声时,与未被提醒的人相比,会感到更加「百感交集」。我们关注该论文的第 2 部分研究(共 2 项),该研究在毕业典礼当天对大学毕业生进行了调查。毕业生被随机分为两组:一组被提醒这是他们作为学生的最后一天,另一组则没有收到任何提醒。随后毕业生对自己此刻的情绪进行评估。

还有这一项

在前一个练习中看到过「洛杉矶」这个词的参与者,会更偏好对这座城市具体而微观的描述;没有看到过的参与者,则更偏好抽象而宏观的描述。

我还可以一直列举下去——心理学里大多数研究本来就是这个样子。有一项备受瞩目的大规模复现研究,想要搞清楚给字母「e」画上横线之后,人们给数字「找不同」的能力会不会变差。(后来还有二次复现实验,换了个略有不同的方式来检验同一假设。)另一项大型复制研究则试图一劳永逸地解决一个问题:当人们听笑话时,用牙咬着笔、与用嘴唇叼着笔,哪个会让笑话更好笑,就像这样:

img

这都是些啥啊?

这些研究都没能通过实验历史检验:它们要么跟人类毫无利害关系,要么没让我有任何触动,或者两者兼而有之。我尊重原作者和复制者们的工作,但说实话,我真的不太在乎让人读了「洛杉矶」或者划掉一堆「e」之后会发生什么。你在乎吗,Kyle?

这就是为什么,每当有人为「复现危机」急得跳脚,我都一脸困惑。我理解有些人的职业生涯系于此,而且人人大都爱看大牌教授被扯掉底裤。但如果受到影响的不过就是这些研究,那又何必哀嚎发怒?(希望他们咬牙切齿时,先把叼着的笔从嘴里拿出来)为什么科学期刊里这些末日论调的文章一篇接着一篇(1, 2, 3, 4, 5),《大西洋月刊》(1, 2, 3, 4, 5)和《纽约时报》(1, 2, 3, 4, 5)这样的大众媒体也跟着轮番炒作?为什么派对上总有人来扫我的兴?说真的,Kyle,你到底想怎样?

我有个猜想。实际上,是三个猜想。我认为你脑子里装着三个关于科学运作方式的巨大谬误。而且我觉得不只是你,Kyle,我也不怪你——大多数心理学家,甚至大多数科学家,恐怕也迷信这些谬误,因为我看到很多人的行事方式都像在把它们当信条,却从未见有人试图去戳破它们。那就由我来做吧。「再给我来一杯!」

坍塌的城堡

好,我敢打赌,你肯定有意无意地迷信一个教条。你认为科学研究就像用石头建造一座宏伟的城堡。每一个发现,无论多么微小,都能让城堡更高、更坚固。如果你相信这一点,难怪你会觉得有些研究无法复现是个严重的问题——这意味着地基在崩塌,整座城堡都可能倾覆。

我不敢妄言所有科学领域,但心理学不是这么运作的。我们没有宏伟的大统一理论。有一些局部理论,但大多数时候根本没有理论。所以我们并没有一座石块鳞次栉比堆叠而成的宏伟城堡;我们有的只是几间石屋和散落一地的无数石块。这意味着,试图复现心理学研究,有点像去踢其中的一块石头,看着它碎成粉末,然后感叹道:「啊哈!这上面什么都建不起来!」但问题是,那上面本来就没建任何东西。

你可以自己验证这一点。拿出手机,随便找一篇心理学论文,点击「被引用」(这里是那篇“嘴里含笔”的原始研究论文),你可以在那里看到每一篇引用该研究的后续论文。当你看到成百上千甚至数千篇论文时,你可能会假设这意味着很多发现都依赖于这一发现的真实性。但事实并非如此。如果你读几篇那些「引用了」的论文,你会发现即便删掉引用相关内容,它们的内容基本都不会有任何改变。所以,即使一篇论文有海量的引用,大多也只是人们在指着那块石头,而不是把自己的石头叠在上面。

对我自己的工作来说确实如此。我回顾了自己最近发表的几篇论文,统计了引用次数,然后计算其中有多少是关键引用——意味着如果拿掉那篇论文,我的论文就会陷入大麻烦。平均而言,只有约 15% 的引用是关键的,而且其中有一半都来自我使用的统计数据软件。

(你可能会问:既然如此,科学家为什么要往论文里塞那么多无关紧要的引用?问得好,Kyle。主要是为了讨好审稿人。比方说,如果你在写关于「注意瞬脱」的论文,你可以引用所有人对注意瞬脱发表过的所有看法,以此证明你是个称职的小科学家,无论这些看法是否对你的研究有用。此外,你引用文章的作者中,可能有些人最终会审阅你的论文,你可以确信他们一定会寻找自己的名字。)

较老的科学领域可能比心理学更具累积性,但正如 Thomas Kuhn 在 60 年前在《科学革命的结构》里指出的那样(你以为能撇下 Kuhn 开完这场派对?想得美!),每个领域都会经历建造城堡和摧毁城堡的循环,许多石头在城堡坍塌的过程中无法幸存。比如,假设你当年跟着佩加蒙的盖伦读博(译注:克劳狄乌斯·盖伦,古罗马的医学家、哲学家),没准你会写一篇关于痰液之类东西的论文,因为从体液理论来看,这是最重要的研究方向。然而体液理论后来被彻底推翻,你的论文也随之化为尘埃。抱歉了,老兄,这就是科学!「再来一杯!」Kyle,我还没说完呢。

青春期的科学

我认为你脑子里还有第二个谬误,我要像挤粉刺一样把它挤破。

你可能看到人们获得博士学位、发表论文、找到工作等等,心想「嗯,一定会有什么重要的事情发生」。并非如此!这一切真的可能全是白费力气。这就是科学职业化后你会遇到的问题——科学家的身份总是让一切看起来非常严肃且意义重大,哪怕事实并非如此。科学的很大一部分只是人们在玩科学游戏:拉下杠杆,得到结果,再拉几次,拿到资助,拉得足够多,你就能获得终身教职,这让你赢得了继续拉那个杠杆直到去世的权利。

心理学还有一个额外的问题:它是一门年轻的学科,我们对什么重要、什么不重要根本没有把握。一百年前,这个领域中的一个时髦理论是小男孩都是想弑父并和母亲啪啪的。我们还在摸索阶段,懂?就像所有青少年一样,今天我们痴迷于某件事(穿一身黑、听 The Smiths、研究自我内耗),明天我们就转向了另一件事。这意味着漫无目的地复现心理学研究——就像现在一直在做的那样——有点像闯进一间挤满青少年的地下室并大喊:「我们必须马上彻底搞清楚、染蓝头发并在 Hot Topic 买衣服、到底是不是真的酷!」然后人家会回你:哦伙计,冷静点,明天我们就会染成别的颜色,去别的地方买 T 恤。还有,你是怎么进我们地下室的???

所以我认为,「大多数心理学研究能复现吗?」是一个错误的问题。正确的问题应该是「大多数心理学研究重要吗?」我想答案是:大概不重要。我知道这听起来像是在批评——「心理学好蠢啊,笑死」——但我真的是在做一种描述。我们并不清楚什么才是重要的,在弄明白之前,我们会做很多奇奇怪怪的事情,这没关系。

我自己也接受这种描述:我自己的研究是否重要也并不明确。我的研究内容诸如:对话不会在人们想结束时结束人们不知道公众舆论发生了怎样的变化流行文化已经变成了寡头垄断,我认为这些课题都很重要。但如果你就是不在乎,我没有任何客观的东西能说服你。这不像你有一套你的物理学,我有一套我的,我们可以各自试着造一座桥,看看哪座屹立不倒,哪座会坍塌。你真的只能去尝试很多想法,培养对「好想法」的嗅觉。这就是我读博的原因:我想跟着一个鼻子灵的人学习。

你可能认为数字和统计能区分重要与不重要的事情。它们做不到,Kyle!我们使用统计学是为了帮我们弄清什么是真实的。但很多真实的事情并不重要。「蒙住眼睛的人更容易撞车。」「当你大声播放 Insane Clown Posse 的金属说唱 时,人们很难入睡。」「比起被踢头,人们更喜欢收到 5 美元。」我确信所有这些假设都能产生巨大的效应量。它们都是真实的,但没有一个是重要的

「如果科学的重要性只是一种主观判断,那又能怎样?」现在我们谈到关键点了。我真心认为,某些事情比其他事情更重要,这种重要性超越了任何个人的主观感受——尽管没有客观方式可以加以证明。我承认,Kyle,这是一种宗教般的信念。但相信它、在意它并为之据理力争是非常重要的。(这就是我写了《心理学中被低估的想法》的原因。)

我想你也信这一套,Kyle。你是个三十多岁的男人,所以你肯定认为《黑道家族》是比《爱之岛》更好的电视剧,尽管你也会承认这并非「客观上」更好。好,但如果我们就此举手投降,说「唉,反正没法客观判断哪种艺术更好」,那我们就没有任何理由去烧钱制作精品剧,只能去看廉价的垃圾片了。偶尔来点廉价垃圾倒也无妨,但你我都想生活在一个能拍出《黑道家族》的世界里。为此,我们需要相信有些东西就是比其他东西更好,即便没有数据支持。心理学也好,任何科学也罢,道理都一样:要做出最好的工作,我们就必须相信有些问题是重要的,有些则不值得。哪怕根本没有客观的比较标准。

所以,如果你觉得我的想法臭不可闻,那也没关系——离我远点就行!但现在,先别跑,Kyle,我还没跟你说完呢

我很遗憾地通知你:你仍然活在黑暗时代

Kyle,我还要纠正你的一个谬误。我确信你深藏于心,却从未宣之于口。

你认为自己出生在一个启蒙时代。你认为你的祖先深受萨满和江湖骗子之苦,而你正享受着几个世纪科学探索的果实。我理解这种念头。我们在高中拿到化学课本时,书后并没有留下一千页空白,以待书写「我们尚未发现的所有化学知识」。课文一直印到封底,仿佛这就是化学世界的全部了。

但是,Kyle,尽管自从伽利略举起望远镜、胡克俯身显微镜以来,人类学到了无数知识,我们依然活在黑暗时代。看看你的周围:物理学家不知道冷水和热水哪个先结冰球状闪电偶尔会凭空出现,而没人知道为什么;身而为人会有某种感觉(「意识」),而对此我们没有任何像样的解释;宇宙中大约 85% 的物质是「假设性的」,换言之我们并不真正确定它是否存在。(正因为这些层出不穷的谜团的存在,让我发誓要跟所有声称「创意越来越难找」的人死磕到底。)

只要去看一次医生,你就能立刻领会到我们身处黑暗时代。肚子疼?你可能要加入 2500 多万被诊断为肠易激综合征的美国人行列,这个词简单来说意思是「我们不知道你为什么肚子疼」。得了癌症?我们最先进的癌症治疗归根结底就是「医生努力把你搞垮,而你只能祈祷癌细胞比你先挂」。情绪严重低落?医生能做的是:a、跟你聊一会儿,看看有没有用;b、给你一些药,服用一个月后,可能会让你感觉好一点点(而且没人知道为什么);或者 c、给你通电

(顺便提一下,至于那些昂贵的药物?其中大部分对大多数人都没有作用。)

我有扁平足,小时候脚疼得很厉害,于是我去看足科医生,满心期待在这个「科学与理性」的时代总该有些办法。他告诉我,他们可以打碎我的脚踝并重做一对,也许能让我多跑十年。或者他可以在我的脚踝里动手术植入一个塞子,每六年更换一次。我想了一下,我告诉他,我的脚其实也没那么疼。

我们生活的时代比以往都要光明,但我们依然所知甚少。如果你没有意识到这一点,每当你听说又一个科学发现未能复刻,你可能会觉得自己与生俱来的知情权被剥夺了。但那本来就不是你的。或者即便它是,它也属于每一个曾经活过的人,就像它属于你一样。数十亿人在无知中生老病死,你我也不例外。我们所能做的,就是努力让这个世界留下的无知少一点点。

盗火

夜深了,Kyle。但我还有最后一件事必须告诉你。

你知道普罗米修斯吗——那位从众神那里盗取火种并赠予人类,使人类得以创造文明的希腊神祇?其实,世界各地的文化都有类似的传说:乌鸦、负鼠、蜘蛛,形形色色的骗子与英雄,窃取火种并交给凡人。而事实上,在这些故事中,火似乎更多是被盗取的,而不是被馈赠的。这是为什么?

也许是因为人类一直意识到,自然从不情愿交出她的秘密。如果你试着去探索丛林,她会派蛇和蚊子阻拦你。如果你试着去探索山脉、海洋或天空,她会隔绝你的氧气。你甚至无法探索细胞和原子,因为她把它们造得小到我们看不见。天呐,她甚至设定了柠檬能治坏血病而青柠却不行

于是,我们制备工具、组建团队,去撬开自然的知识宝库。我们制定计划,招募专家。时机一成熟,我们就尽可能多地带走知识。事实上,每一个发现都是一次洗劫。

最深、最难攻破的宝库,是人类的心智。大自然用偏见和幻觉守护着它,还诱使我们相信:仅凭身处其中,就足以了解自己的心智。这正是我们在其他科学领域的进展远超心理学的原因。古希腊人发明了民主,算出了圆周率,建造了至今屹立不倒的宏伟柱廊。他们还相信,人类的情感源自肝脏。当 NASA 将第一批卫星送入太空时,心理学家们仍然断言:人类心智的内部运作永远无从知晓,所以根本不该去尝试。

没关系——这意味着我们仍有机会完成有史以来最伟大的劫案。科学界最宏大、最闪亮的明珠——人们为什么做他们正在做的事?——依然躺在大自然的宝库里,等着我们去钻开铁锁、熔掉铰链、炸开大门,不惜一切代价。我要么偷走那颗明珠,要么死在路上。

所以,Kyle,如果今晚你没有别的收获,我希望你至少学会一件事:不要仅仅根据你听过的一期播客,就去质疑别人整个人生的意义。现在失陪一下,我真的要去趟洗手间了。